首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏全栈程序员必看

    MCTS (Monte Carlo Tree Search)

    以下文章摘录自: 《机器学习观止——核心原理与实践》 (由于博客系统问题,部分公式、图片和格式有可能存在显示问题,请参阅原书了解详情) MCTS (Monte Carlo Tree Search) 1.1 我们先简单回顾一下Monte Carlo Method,它起源于二战时期的“曼哈顿计划”。 一方面是出于保密性考虑,另一方面蒙特卡洛方法本身就和随机事件相关联,所以冯诺依曼等科学家就以世界闻名的摩纳哥赌城为其命名,即Monte Carlo

    7.4K10编辑于 2022-06-28
  • 来自专栏UAI人工智能

    蒙特卡洛树搜索 Monte Carlo Tree Search

    全称 Monte Carlo Tree Search,是一种人工智能问题中做出最优决策的方法,一般是在组合博弈中的行动(move)规划形式。它结合了随机模拟的一般性和树搜索的准确性。 1940s:Monte Carlo 方法形成,作为一种通过随机采样解决不太适合树搜索解决的弱良定义问题的方法。 Müller, “Challenges in Monte Carlo Tree Search,” 2010 [Online]. Rimmel, “Havannah, Monte Carlo Enhancements and Linear Transforms,” 2010 [Online]. www.aigamesnetwork.org/_media/main:events:presmctsworkshop_rimmel.pdf https://jeffbradberry.com/posts/2015/09/intro-to-monte-carlo-tree-search

    4.4K40发布于 2018-06-21
  • 来自专栏从流域到海域

    Monte Carlo Off Policy Evaluation

    本文链接:https://blog.csdn.net/Solo95/article/details/102672689 前面的一篇博文Monte Carlo(MC) Policy Evaluation 在某些领域(例如图示)尝试采取动作观察结果代价很大或者风险很高 因此我们希望能够根据以前的关于策略决策的旧数据和已有与之相关的结果来评估一个替代策略可能的价值 Monte Carlo(MC) Off Policy

    93810发布于 2019-10-24
  • 来自专栏从流域到海域

    Monte Carlo Tree Search (MCTS) 蒙特·卡罗尔树搜索

    本文链接:https://blog.csdn.net/Solo95/article/details/103218744 Monte Carlo Tree Search 为什么要学习MCTS 一部分原因是过去 RL 从经验中学习一个模型 从该模型中规划出价值函数(和/或策略) 当你有一个simulator(模拟器)的时候,你可以从模拟器中获取经验,然后: DP model-free RL policy search

    98430发布于 2019-11-26
  • 来自专栏趣Python

    #python# Monte Carlo算法画π

    Monte Carlo算法画π # encoding=utf8 import matplotlib.pyplot as plt import random def get_random_point(

    71310发布于 2019-09-10
  • 来自专栏LET

    Differentiable Monte Carlo Ray Tracing

    本文是‘Differentiable Monte Carlo Ray Tracing through Edge Sampling’这篇论文的学习总结。

    1.8K31发布于 2021-01-18
  • 来自专栏LET

    Monte Carlo与Light Equation

    Monte Carlo的数学推导 为什么Monte Carlo可以求解积分 期望值定义: ? 基于LLD, Monte Carlo方法实现了一种以离散的方式解决积分的办法,可以让i无限接近I。这种思路非常实用,比如一个复杂函数的积分,而且简单易用,具有通用性。 ? 改善Monte Carlo采样方法 举个栗子,你打算找一个伴侣,给你三个选择,a) github,b) 梦境里,c)千山万水,给你三次机会,你会如何分配? 为了更高效的提高光线追踪的收敛速度,Eric Veach在那篇旷世论文《ROBUST MONTE CARLO METHODS》中提到了MIS(Multiple IS)方法,思路很简单,我们提供多个曲线来拟合

    59420发布于 2019-10-14
  • 来自专栏技术汇总专栏

    让智能体学会“提前思考”:基于 Monte Carlo Tree Search 的长期规划方法

    因此,行业开始尝试使用搜索(Search)来弥补大模型的规划不足,而MCTS成为了最有潜力的方案。

    41410编辑于 2025-12-05
  • 来自专栏又见苍岚

    蒙特卡洛(Monte Carlo)方法

    简介 蒙特卡洛方法Monte Carlo 可以通过采用随机投点法来求解不规则图形的面积。 求解结果并不是一个精确值,而是一个近似值。当投点的数量越来越大时,该近似值也越接近真实值。 参考资料 http://www.huaxiaozhuan.com/数学基础/chapters/4_monte_carlo.html

    1.9K10编辑于 2022-08-05
  • 来自专栏又见苍岚

    Markov Chain Monte Carlo 采样算法

    作为一种随机采样方法,马尔科夫链蒙特卡罗(Markov Chain Monte Carlo,以下简称MCMC)在机器学习,深度学习以及自然语言处理等领域都有广泛的应用,是很多复杂算法求解的基础,本文介绍基本思想 简介 马尔科夫链蒙特卡洛方法(Markov Chain Monte Carlo),简称MCMC,产生于20世纪50年代早期,是在贝叶斯理论框架下,通过计算机进行模拟的蒙特卡洛方法(Monte Carlo 该方法将马尔科夫(Markov)过程引入到Monte Carlo模拟中,实现抽样分布随模拟的进行而改变的动态模拟,弥补了传统的蒙特卡罗积分只能静态模拟的缺陷。 参考资料 http://www.huaxiaozhuan.com/数学基础/chapters/4_monte_carlo.html https://www.cnblogs.com/pinard/p/6625739

    1K20编辑于 2022-08-05
  • 来自专栏气象学家

    MCMC(Markov Chain Monte Carlo)的理解与实践(Python)

    内容目录:MCMC(Markov Chain Monte Carlo)的理解与实践(Python) Markov Chain Monte Carlo (MCMC) methods are a class MCMC(Markov Chain Monte Carlo)用MCMC采样算法实现对Beta 分布的采样 MCMC(Markov Chain Monte Carlo) ?

    1.5K20发布于 2020-07-03
  • 来自专栏3D点云深度学习

    点云蒙特卡罗卷积网络Monte Carlo Convolution

    标题:Monte Carlo Convolution for Learning on Non-Uniformly Sampled Point Clouds 作者:Hermosilla, P. and Ritschel representing the convolution kernel itself as a multilayer perceptron; second, phrasing convolution as a Monte Carlo integration problem, third, using this notion to combine information from multiple samplings at guarantee adequate consideration of the underlying non-uniform sample distribution function from a Monte Carlo perspective.

    1.2K30发布于 2020-05-18
  • 来自专栏生物信息学、python、R、linux

    蒙特卡洛随机方法模拟(Monte Carlo method)

    蒙特卡洛随机方法,即统计模拟方法,是一类以概率统计理论为指导的数值计算方法。本质上是用部分估计整体,采样越多,则越近似最优解。

    1.5K20发布于 2020-04-01
  • 来自专栏LET

    Langevin Monte Carlo Rendering with Gradient-based Adaptation

    今天这篇论文,就是基于Hessian-Hamiltonian MC (H2MC) Rendering论文的思想,引入Langevin Monte Carlo Rendering实现渲染上的优化。 级别的exploration 通过controlled MCMC理论结果确保算法的遍历性和正确性 该论文涉及的研究包括gradient-based and controlled Markov chain Monte Carlo、MCMC rendering、derivatives in rendering、caching in rendering。

    92110发布于 2021-06-21
  • 来自专栏从流域到海域

    Monte Carlo(MC) Policy Evaluation 蒙特·卡罗尔策略评估

    新内容:在没有模型的条件下进行策略价值评估 给定数据/或与环境交互的能力 足够计算策略π\piπ的合理估计 Monte Carlo(MC) Policy Evaluation 蒙特·卡罗尔策略评估 Gt Monte Carlo(MC) Policy Evaluation 目标:在策略π\piπ下给定的所有轮次下估计VπV^\piVπ s1,a1,r1,s2,a2,r2,...s_1,a_1,r_1,s Every-Visit Monte Carlo (MC) On Policy Evaluation Algorithm Initialize N(s)=0N(s) = 0N(s)=0, G(s)=0 ∀ Monte Carlo (MC) Policy Evaluation Key Limitations 通常是个高方差估计器 降低这些方差需要大量数据 要求必须是可重复情景 一个轮次在该轮次的数据用于更新价值函数前该伦次必须能结束 Monte Carlo (MC) Policy Evaluation Summary 目标:在给定由于遵循策略π\piπ而产生的所有轮次的条件下估计Vπ(s)V^\pi(s)Vπ(s) s1,a1,

    79820发布于 2019-10-22
  • 来自专栏巴山学长

    你所不知道的Monte Carlo形式

    公众号之前有讲了好几期关于Monte Carlo算法的推文。过冷水自以为感觉能够让大家明白什么是Monte Carlo算法。 这个时候就可以用Monte Carlo 方法:在(a,b)区域内均匀随机抽样得到N个点x1、x2、x3、... 这个过程你都感觉不到统计力学的身影,这就是Monte Carlo的另一种思想。平均数的概念都能被玩出花来。数学家群体是一群奇迹般的存在。这个方法和之前所讲的算法完全不一样。 过冷水之前以为的Monte Carlo算法是通过随机撒点求所求区域占规则形状的面积比值然后用规则面积*比值即为所求面积面积。我们来实战演示一下两种思路求积分的具体过程。 ? ? 今天学一点Monte Carlo,明天学一点正态分布的评估方法,菲尔兹奖它日可期。

    48320发布于 2020-06-09
  • 来自专栏小浩算法

    伪蒙特卡洛(Quasi-Monte Carlo, QMC)随机

    蒙特卡洛方法(Monte Carlo Method) 指的是一类使用随机变量解决概率问题的方法。比较常见的是计算积分、计算概率、计算期望等问题。

    2.4K10发布于 2020-03-30
  • 来自专栏拓端tecdat

    Python Monte Carlo K-Means聚类实战研究|附代码数据

    在本文中,188个国家基于这19个社会经济指标聚集在一起,使用Python实现的蒙特卡罗K-Means聚类算法。通过将类似国家分组在一起并对其进行概括,聚类可以减少发现有吸引力投资机会所需的工作量

    46500编辑于 2023-07-03
  • 来自专栏机器和智能

    蒙特卡罗(Monte Carlo)方法——从数学原理到实际案例

    Monte Carlo方法简介 Monte Carlo方法是一种应用随机数来进行计算机模拟的方法,通过对所研究系统进行随机观察抽样并对样本值进行统计分析,来得到所研究系统的某些参数。 Monte Carlo方法的理论依据是大数定律和中心极限定理。 Monte Carlo方法 Monte Carlo方法适用于本身就具有随机性的问题或者能够转化为概率模型进行求解的确定性问题。 Monte Carlo方法的模拟手段 模拟是Monte Carlo方法的重要手段,一般通过物理或者数学模型来近似类比,模拟现实系统的演变过程,来寻找其规律。 Monte Carlo方法的收敛性与误差 Monte Carlo方法作为一种计算方法,有必要讨论其收敛性以及误差。 收敛性 蒙特卡罗方法的收敛性可以由大数定律给出。 随机数的产生和随机数的意义 在前面说过,随机数(RNs)是Monte Carlo的基石,随机试验是Monte Carlo的实现核心。

    5.4K10编辑于 2025-05-15
  • 来自专栏绿巨人专栏

    强化学习读书笔记 - 05 - 蒙特卡洛方法(Monte Carlo Methods)

    强化学习读书笔记 - 05 - 蒙特卡洛方法(Monte Carlo Methods) 学习笔记: Reinforcement Learning: An Introduction, Richard S

    2.1K50发布于 2018-05-17
领券